Tomasz Klimanek https://orcid.org/0000-0001-6411-8145 , Tomasz Józefowski https://orcid.org/0000-0001-9485-1946 , Andrzej Młodak https://orcid.org/0000-0002-6853-9163 , Amelia Wardzińska-Sharif https://orcid.org/0009-0001-8231-8113

© Tomasz Klimanek, Tomasz Józefowski, Andrzej Młodak, Amelia Wardzińska-Sharif Artykuł udostępniony na licencji CC BY-SA 4.0

ARTYKUŁ

(Polski) PDF

STRESZCZENIE

Udostępnianie podstawowych danych pochodzących z Narodowego Spisu Po-wszechnego Ludności i Mieszkań (NSP) w przekroju siatki kilometrowej należy uznać za jeden z najważniejszych kierunków upowszechniania wyników spisowych, a zarazem spełnienie krajo-wych i międzynarodowych wymogów w tym zakresie. Z uwagi na to, że komórki siatki są rela-tywnie małe (kwadraty 1 km×1 km), a ryzyko identyfikacji konkretnej osoby i ujawnienia jej da-nych wrażliwych jest znaczne, niezbędne staje się podjęcie stosownych działań ochronnych. Ce-lem artykułu jest omówienie najważniejszych działań z zakresu kontroli ujawniania danych na przykładzie danych zebranych podczas NSP 2021 oraz zaproponowanie możliwych do zastoso-wania w tym przypadku metod i narzędzi kontroli. W szczególności dotyczy to podejść niezakłó-ceniowych, czyli takich, które prowadzą do ukrywania danych wrażliwych. Ponadto w artykule wskazano najistotniejsze problemy i wyzwania związane z podjęciem tego rodzaju działań ochronnych w zależności od zakresu udostępnianych informacji, ponieważ liczba i rodzaj zmien-nych mają kluczowe znaczenie dla ryzyka identyfikacji jednostki i doboru narzędzi ochronnych. Przedstawiono także propozycje rozwiązań metodologicznych i technicznych. Analizy wykazały, że ochrona danych stanowi ważne wyzwanie w rozpatrywanym przypadku, zwłaszcza gdy należy kontrolować ujawnianie danych z kilku powiązanych ze sobą baz danych – wówczas konieczne jest uwzględnienie logicznych i matematycznych powiązań między zbiorami. Dodatkowym czynnikiem ryzyka może się okazać gęstość lub hierarchiczność siatki.

SŁOWA KLUCZOWE

siatka kilometrowa, kontrola ujawniania danych, metody niezakłóceniowe, spis powszechny

JEL

C54, C63, C83

BIBLIOGRAFIA

Branchu, M., Costemalle, V., & Fontaine, M. (2018). Données carroyées et confidentialité. Journées de Méthodologie Statistiques de l’Insee, 13, 1–23. http://www.jms-insee.fr/2018/S23_3_ACTE_BRANCHU_JMS2018.pdf.

Dygaszewicz, J. (2012). Spisy powszechne jako źrodło danych do analiz geoprzestrzennych. Archi-wum Fotogrametrii, Kartografii i Teledetekcji, 23, 91–100. https://ptfit.sgp.geodezja.org.pl/wydawnictwa/archiwum_vol_23/Dygaszewicz.pdf.

Eurostat. (2019). EU legislation on the 2021 population and housing censuses. Explanatory notes. Pub-lications Office of the European Union. https://ec.europa.eu/eurostat/docments/3859598/9670557/KS-GQ-18-010-EN-N.pdf/c3df7fcb-f134-4398-94c8-4be0b7ec0494?t=1552653277000.

Gussenbauer, J. (2023, 30 sierpnia). Target Record Swapping. https://cran.r-project.org/web/pack-ages/sdcMicro/vignettes/recordSwapping.html.

Hundepool, A., Domingo-Ferrer, J., Franconi, L., Giessing, S., Nordholt, E. S., Spicer, K., & de Wolf, P.-P. (2012). Statistical Disclosure Control. John Wiley & Sons. https://doi.org/10.1002/9781118348239.

Młodak, A., Pietrzak, M., & Józefowski, T. (2022). The trade-off between the risk of disclosure and data utility in SDC: A case of data from a survey of accidents at work. Statistical Journal of the IAOS, 38(4), 1503–1511. https://doi.org/10.3233/SJI-220936.

Młodak, A., Pietrzak, M., Klimanek, T., Józefowski, T., & Lańduch, P. (2023). Poufność a użyteczność informacji statystycznych. Dylematy ochrony udostępnianych danych. Wydawnictwo Uniwersytetu Ekonomicznego w Poznaniu. https://doi.org/10.18559/978-83-8211-168-2.

Pietrzak, M., Józefowski, T., Klimanek, T., & Młodak, A. (2022). An Optimized Selection of Statisti-cal Disclosure Control Methods – A Case Study Involving Microdata from the Polish Survey of Accidents at Work. W: K. Jajuga, G. Dehnel, M. Walesiak (Eds.), Modern Classification and Data Analysis: Methodology and Applications to Micro- and Macroeconomic Problems (pp. 63–78). Springer. https://doi.org/10.1007/978-3-031-10190-8_6.

Rozporządzenie Rady Ministrów z dnia 15 października 2012 r. w sprawie państwowego systemu odniesień przestrzennych (Dz.U. 2012 poz. 1247 ze zm.).

Rozporządzenie (WE) nr 1059/2003 Parlamentu Europejskiego i Rady z dnia 26 maja 2003 r. w sprawie ustalenia wspólnej klasyfikacji Jednostek Terytorialnych do Celów Statystycznych (NUTS) (Dz.U. UE L 154/1).

Rozporządzenie wykonawcze Komisji (UE) 2018/1799 z dnia 21 listopada 2018 r. w sprawie ustano-wienia tymczasowego bezpośredniego działania w dziedzinie statystyki dotyczącego rozpo-wszechniania wybranych tematów spisu ludności i mieszkań w 2021 r. i geokodowanych w siatce kilometrowej (Dz.U. L 296 z 22.11.2018).

System informacji przestrzennej. (n.d.). W: Internetowy leksykon geomatyczny. https://www.ptip.info/LMB/system-informacji-przestrzennej.

United Nations. (2017). Principles and Recommendations for Population and Housing Censuses: the 2020 Round (Revision 3). https://unstats.un.org/unsd/demographic-social/Standards-and-Methods/files/Principles_and_Recommendations/Population-and-Housing-Censuses/Series_M67rev3-E.pdf.

Do góry
© 2019-2022 Copyright by Główny Urząd Statystyczny, pewne prawa zastrzeżone. Licencja Creative Commons Uznanie autorstwa - Na tych samych warunkach 4.0 (CC BY-SA 4.0) Creative Commons — Attribution-ShareAlike 4.0 International — CC BY-SA 4.0